Dataset statistics
| Number of variables | 40 |
|---|---|
| Number of observations | 21202 |
| Missing cells | 0 |
| Missing cells (%) | 0.0% |
| Duplicate rows | 0 |
| Duplicate rows (%) | 0.0% |
| Total size in memory | 6.5 MiB |
| Average record size in memory | 320.0 B |
Variable types
| CAT | 28 |
|---|---|
| NUM | 12 |
Reproduction
| Analysis started | 2020-11-19 20:38:29.175040 |
|---|---|
| Analysis finished | 2020-11-19 20:39:07.806052 |
| Duration | 38.63 seconds |
| Version | pandas-profiling v2.8.0 |
| Command line | pandas_profiling --config_file config.yaml [YOUR_FILE.csv] |
| Download configuration | config.yaml |
IN_SURDO_CEGUEIRA has constant value "Não" | Constant |
NU_NOTA_REDACAO is highly correlated with NU_NOTA_COMP3 | High correlation |
NU_NOTA_COMP3 is highly correlated with NU_NOTA_REDACAO | High correlation |
IN_TREINEIRO is highly correlated with TP_ST_CONCLUSAO | High correlation |
TP_ST_CONCLUSAO is highly correlated with IN_TREINEIRO | High correlation |
NU_INSCRICAO has unique values | Unique |
NU_NOTA_COMP1 has 400 (1.9%) zeros | Zeros |
NU_NOTA_COMP2 has 400 (1.9%) zeros | Zeros |
NU_NOTA_COMP3 has 402 (1.9%) zeros | Zeros |
NU_NOTA_COMP4 has 400 (1.9%) zeros | Zeros |
NU_NOTA_COMP5 has 2558 (12.1%) zeros | Zeros |
NU_NOTA_REDACAO has 400 (1.9%) zeros | Zeros |
| Distinct count | 21202 |
|---|---|
| Unique (%) | 100.0% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Infinite | 0 |
| Infinite (%) | 0.0% |
| Mean | 190003732873.80817 |
|---|---|
| Minimum | 190001043648 |
| Maximum | 190006119150 |
| Zeros | 0 |
| Zeros (%) | 0.0% |
| Memory size | 165.6 KiB |
Quantile statistics
| Minimum | 1.900010436e+11 |
|---|---|
| 5-th percentile | 1.900017004e+11 |
| Q1 | 1.900026492e+11 |
| median | 1.900038727e+11 |
| Q3 | 1.900048775e+11 |
| 95-th percentile | 1.900059567e+11 |
| Maximum | 1.900061192e+11 |
| Range | 5075502 |
| Interquartile range (IQR) | 2228387.25 |
Descriptive statistics
| Standard deviation | 1477041.164 |
|---|---|
| Coefficient of variation (CV) | 7.773748133e-06 |
| Kurtosis | -1.356740481 |
| Mean | 1.900037329e+11 |
| Median Absolute Deviation (MAD) | 1206787.5 |
| Skewness | -0.02656166832 |
| Sum | 4.028459144e+15 |
| Variance | 2.181650599e+12 |
| Value | Count | Frequency (%) | |
| 1.900026409e+11 | 1 | < 0.1% | |
| 1.900026723e+11 | 1 | < 0.1% | |
| 1.90005923e+11 | 1 | < 0.1% | |
| 1.900017916e+11 | 1 | < 0.1% | |
| 1.900059634e+11 | 1 | < 0.1% | |
| 1.900047935e+11 | 1 | < 0.1% | |
| 1.900059664e+11 | 1 | < 0.1% | |
| 1.90001724e+11 | 1 | < 0.1% | |
| 1.900048864e+11 | 1 | < 0.1% | |
| 1.900038499e+11 | 1 | < 0.1% | |
| Other values (21192) | 21192 | > 99.9% |
| Value | Count | Frequency (%) | |
| 1.900010436e+11 | 1 | < 0.1% | |
| 1.900016848e+11 | 1 | < 0.1% | |
| 1.900016848e+11 | 1 | < 0.1% | |
| 1.900016848e+11 | 1 | < 0.1% | |
| 1.900016848e+11 | 1 | < 0.1% |
| Value | Count | Frequency (%) | |
| 1.900061192e+11 | 1 | < 0.1% | |
| 1.900061191e+11 | 1 | < 0.1% | |
| 1.900061191e+11 | 1 | < 0.1% | |
| 1.900061178e+11 | 1 | < 0.1% | |
| 1.900061178e+11 | 1 | < 0.1% |
NU_IDADE
Real number (ℝ≥0)
| Distinct count | 62 |
|---|---|
| Unique (%) | 0.3% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Infinite | 0 |
| Infinite (%) | 0.0% |
| Mean | 22.30266012640317 |
|---|---|
| Minimum | 13 |
| Maximum | 77 |
| Zeros | 0 |
| Zeros (%) | 0.0% |
| Memory size | 165.6 KiB |
Quantile statistics
| Minimum | 13 |
|---|---|
| 5-th percentile | 17 |
| Q1 | 18 |
| median | 19 |
| Q3 | 23 |
| 95-th percentile | 40 |
| Maximum | 77 |
| Range | 64 |
| Interquartile range (IQR) | 5 |
Descriptive statistics
| Standard deviation | 8.028488113 |
|---|---|
| Coefficient of variation (CV) | 0.3599789473 |
| Kurtosis | 7.203634055 |
| Mean | 22.30266013 |
| Median Absolute Deviation (MAD) | 2 |
| Skewness | 2.551984968 |
| Sum | 472861 |
| Variance | 64.45662138 |
| Value | Count | Frequency (%) | |
| 18 | 4699 | 22.2% | |
| 17 | 2924 | 13.8% | |
| 19 | 2716 | 12.8% | |
| 20 | 1816 | 8.6% | |
| 21 | 1270 | 6.0% | |
| 22 | 943 | 4.4% | |
| 16 | 885 | 4.2% | |
| 23 | 772 | 3.6% | |
| 24 | 604 | 2.8% | |
| 25 | 520 | 2.5% | |
| Other values (52) | 4053 | 19.1% |
| Value | Count | Frequency (%) | |
| 13 | 2 | < 0.1% | |
| 15 | 107 | 0.5% | |
| 16 | 885 | 4.2% | |
| 17 | 2924 | 13.8% | |
| 18 | 4699 | 22.2% |
| Value | Count | Frequency (%) | |
| 77 | 1 | < 0.1% | |
| 74 | 1 | < 0.1% | |
| 73 | 2 | < 0.1% | |
| 72 | 2 | < 0.1% | |
| 71 | 3 | < 0.1% |
TP_SEXO
Categorical
| Distinct count | 2 |
|---|---|
| Unique (%) | < 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Memory size | 165.6 KiB |
| F | |
|---|---|
| M |
| Value | Count | Frequency (%) | |
| F | 12409 | 58.5% | |
| M | 8793 | 41.5% |
Length
| Max length | 1 |
|---|---|
| Median length | 1 |
| Mean length | 1 |
| Min length | 1 |
TP_ESTADO_CIVIL
Categorical
| Distinct count | 5 |
|---|---|
| Unique (%) | < 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Memory size | 165.6 KiB |
| Solteiro(a) | |
|---|---|
| Não informado | 1063 |
| Casado(a)/Mora com companheiro(a) | 818 |
| Divorciado(a)/Desquitado(a)/Separado(a) | 399 |
| Viúvo(a) | 26 |
| Value | Count | Frequency (%) | |
| Solteiro(a) | 18896 | 89.1% | |
| Não informado | 1063 | 5.0% | |
| Casado(a)/Mora com companheiro(a) | 818 | 3.9% | |
| Divorciado(a)/Desquitado(a)/Separado(a) | 399 | 1.9% | |
| Viúvo(a) | 26 | 0.1% |
Length
| Max length | 39 |
|---|---|
| Median length | 11 |
| Mean length | 12.47231393 |
| Min length | 8 |
TP_COR_RACA
Categorical
| Distinct count | 6 |
|---|---|
| Unique (%) | < 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Memory size | 165.6 KiB |
| Branca | |
|---|---|
| Preta | 2580 |
| Parda | 2574 |
| Não declarado | 448 |
| Amarela | 87 |
| Value | Count | Frequency (%) | |
| Branca | 15473 | 73.0% | |
| Preta | 2580 | 12.2% | |
| Parda | 2574 | 12.1% | |
| Não declarado | 448 | 2.1% | |
| Amarela | 87 | 0.4% | |
| Indígena | 40 | 0.2% |
Length
| Max length | 13 |
|---|---|
| Median length | 6 |
| Mean length | 5.912696915 |
| Min length | 5 |
TP_NACIONALIDADE
Categorical
| Distinct count | 5 |
|---|---|
| Unique (%) | < 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Memory size | 165.6 KiB |
| Brasileiro(a) | |
|---|---|
| Brasileiro(a) Naturalizado(a) | 309 |
| Estrangeiro(a) | 61 |
| Brasileiro(a) Nato(a), nascido(a) no exterior | 54 |
| Não informado | 22 |
| Value | Count | Frequency (%) | |
| Brasileiro(a) | 20756 | 97.9% | |
| Brasileiro(a) Naturalizado(a) | 309 | 1.5% | |
| Estrangeiro(a) | 61 | 0.3% | |
| Brasileiro(a) Nato(a), nascido(a) no exterior | 54 | 0.3% | |
| Não informado | 22 | 0.1% |
Length
| Max length | 45 |
|---|---|
| Median length | 13 |
| Mean length | 13.31756438 |
| Min length | 13 |
SG_UF_NASCIMENTO
Categorical
| Distinct count | 28 |
|---|---|
| Unique (%) | 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Memory size | 165.6 KiB |
| RS | |
|---|---|
| missing value | 446 |
| SP | 168 |
| SC | 139 |
| RJ | 122 |
| Other values (23) | 597 |
| Value | Count | Frequency (%) | |
| RS | 19730 | 93.1% | |
| missing value | 446 | 2.1% | |
| SP | 168 | 0.8% | |
| SC | 139 | 0.7% | |
| RJ | 122 | 0.6% | |
| PR | 109 | 0.5% | |
| MG | 56 | 0.3% | |
| PA | 53 | 0.2% | |
| BA | 38 | 0.2% | |
| CE | 37 | 0.2% | |
| Other values (18) | 304 | 1.4% |
Length
| Max length | 13 |
|---|---|
| Median length | 2 |
| Mean length | 2.231393265 |
| Min length | 2 |
| Distinct count | 4 |
|---|---|
| Unique (%) | < 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Memory size | 165.6 KiB |
| Já concluí o Ensino Médio | |
|---|---|
| Estou cursando e concluirei o Ensino Médio em 2019 | |
| Estou cursando e concluirei o Ensino Médio após 2019 | |
| Não concluí e não estou cursando o Ensino Médio | 51 |
| Value | Count | Frequency (%) | |
| Já concluí o Ensino Médio | 12026 | 56.7% | |
| Estou cursando e concluirei o Ensino Médio em 2019 | 6419 | 30.3% | |
| Estou cursando e concluirei o Ensino Médio após 2019 | 2706 | 12.8% | |
| Não concluí e não estou cursando o Ensino Médio | 51 | 0.2% |
Length
| Max length | 52 |
|---|---|
| Median length | 25 |
| Mean length | 36.06777662 |
| Min length | 25 |
TP_ANO_CONCLUIU
Categorical
| Distinct count | 14 |
|---|---|
| Unique (%) | 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Memory size | 165.6 KiB |
| Não informado | |
|---|---|
| 2018 | |
| 2017 | |
| Antes de 2007 | 1752 |
| 2016 | 1368 |
| Other values (9) |
| Value | Count | Frequency (%) | |
| Não informado | 9805 | 46.2% | |
| 2018 | 2095 | 9.9% | |
| 2017 | 2093 | 9.9% | |
| Antes de 2007 | 1752 | 8.3% | |
| 2016 | 1368 | 6.5% | |
| 2015 | 987 | 4.7% | |
| 2014 | 807 | 3.8% | |
| 2013 | 560 | 2.6% | |
| 2012 | 425 | 2.0% | |
| 2011 | 338 | 1.6% | |
| Other values (4) | 972 | 4.6% |
Length
| Max length | 13 |
|---|---|
| Median length | 13 |
| Mean length | 8.905810773 |
| Min length | 4 |
TP_ESCOLA
Categorical
| Distinct count | 3 |
|---|---|
| Unique (%) | < 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Memory size | 165.6 KiB |
| Não Respondeu | |
|---|---|
| Pública | |
| Privada | 2486 |
| Value | Count | Frequency (%) | |
| Não Respondeu | 14783 | 69.7% | |
| Pública | 3933 | 18.6% | |
| Privada | 2486 | 11.7% |
Length
| Max length | 13 |
|---|---|
| Median length | 13 |
| Mean length | 11.18347326 |
| Min length | 7 |
TP_ENSINO
Categorical
| Distinct count | 3 |
|---|---|
| Unique (%) | < 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Memory size | 165.6 KiB |
| missing value | |
|---|---|
| Ensino Regular | |
| Educação Especial - Modalidade Substitutiva | 43 |
| Value | Count | Frequency (%) | |
| missing value | 11877 | 56.0% | |
| Ensino Regular | 9282 | 43.8% | |
| Educação Especial - Modalidade Substitutiva | 43 | 0.2% |
Length
| Max length | 43 |
|---|---|
| Median length | 13 |
| Mean length | 13.4986322 |
| Min length | 13 |
| Distinct count | 2 |
|---|---|
| Unique (%) | < 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Memory size | 165.6 KiB |
| Não | |
|---|---|
| Sim | 2706 |
| Value | Count | Frequency (%) | |
| Não | 18496 | 87.2% | |
| Sim | 2706 | 12.8% |
Length
| Max length | 3 |
|---|---|
| Median length | 3 |
| Mean length | 3 |
| Min length | 3 |
TP_DEPENDENCIA_ADM_ESC
Categorical
| Distinct count | 5 |
|---|---|
| Unique (%) | < 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Memory size | 165.6 KiB |
| missing value | |
|---|---|
| Estadual | 2622 |
| Privada | 1856 |
| Federal | 141 |
| Municipal | 30 |
| Value | Count | Frequency (%) | |
| missing value | 16553 | 78.1% | |
| Estadual | 2622 | 12.4% | |
| Privada | 1856 | 8.8% | |
| Federal | 141 | 0.7% | |
| Municipal | 30 | 0.1% |
Length
| Max length | 13 |
|---|---|
| Median length | 13 |
| Mean length | 11.8108669 |
| Min length | 7 |
TP_LOCALIZACAO_ESC
Categorical
| Distinct count | 3 |
|---|---|
| Unique (%) | < 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Memory size | 165.6 KiB |
| missing value | |
|---|---|
| Urbana | |
| Rural | 3 |
| Value | Count | Frequency (%) | |
| missing value | 16553 | 78.1% | |
| Urbana | 4646 | 21.9% | |
| Rural | 3 | < 0.1% |
Length
| Max length | 13 |
|---|---|
| Median length | 13 |
| Mean length | 11.46495614 |
| Min length | 5 |
TP_SIT_FUNC_ESC
Categorical
| Distinct count | 4 |
|---|---|
| Unique (%) | < 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Memory size | 165.6 KiB |
| missing value | |
|---|---|
| Em atividade | |
| 4.0 | 4 |
| Paralisada | 1 |
| Value | Count | Frequency (%) | |
| missing value | 16553 | 78.1% | |
| Em atividade | 4644 | 21.9% | |
| 4.0 | 4 | < 0.1% | |
| Paralisada | 1 | < 0.1% |
Length
| Max length | 13 |
|---|---|
| Median length | 13 |
| Mean length | 12.77893595 |
| Min length | 3 |
IN_SURDEZ
Categorical
| Distinct count | 2 |
|---|---|
| Unique (%) | < 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Memory size | 165.6 KiB |
| Não | |
|---|---|
| Sim | 8 |
| Value | Count | Frequency (%) | |
| Não | 21194 | > 99.9% | |
| Sim | 8 | < 0.1% |
Length
| Max length | 3 |
|---|---|
| Median length | 3 |
| Mean length | 3 |
| Min length | 3 |
| Distinct count | 1 |
|---|---|
| Unique (%) | < 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Memory size | 165.6 KiB |
| Não |
|---|
| Value | Count | Frequency (%) | |
| Não | 21202 | 100.0% |
Length
| Max length | 3 |
|---|---|
| Median length | 3 |
| Mean length | 3 |
| Min length | 3 |
IN_DEFICIENCIA_FISICA
Categorical
| Distinct count | 2 |
|---|---|
| Unique (%) | < 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Memory size | 165.6 KiB |
| Não | |
|---|---|
| Sim | 36 |
| Value | Count | Frequency (%) | |
| Não | 21166 | 99.8% | |
| Sim | 36 | 0.2% |
Length
| Max length | 3 |
|---|---|
| Median length | 3 |
| Mean length | 3 |
| Min length | 3 |
IN_DEFICIENCIA_MENTAL
Categorical
| Distinct count | 2 |
|---|---|
| Unique (%) | < 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Memory size | 165.6 KiB |
| Não | |
|---|---|
| Sim | 6 |
| Value | Count | Frequency (%) | |
| Não | 21196 | > 99.9% | |
| Sim | 6 | < 0.1% |
Length
| Max length | 3 |
|---|---|
| Median length | 3 |
| Mean length | 3 |
| Min length | 3 |
IN_DEFICIT_ATENCAO
Categorical
| Distinct count | 2 |
|---|---|
| Unique (%) | < 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Memory size | 165.6 KiB |
| Não | |
|---|---|
| Sim | 90 |
| Value | Count | Frequency (%) | |
| Não | 21112 | 99.6% | |
| Sim | 90 | 0.4% |
Length
| Max length | 3 |
|---|---|
| Median length | 3 |
| Mean length | 3 |
| Min length | 3 |
IN_DISLEXIA
Categorical
| Distinct count | 2 |
|---|---|
| Unique (%) | < 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Memory size | 165.6 KiB |
| Não | |
|---|---|
| Sim | 11 |
| Value | Count | Frequency (%) | |
| Não | 21191 | 99.9% | |
| Sim | 11 | 0.1% |
Length
| Max length | 3 |
|---|---|
| Median length | 3 |
| Mean length | 3 |
| Min length | 3 |
IN_DISCALCULIA
Categorical
| Distinct count | 2 |
|---|---|
| Unique (%) | < 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Memory size | 165.6 KiB |
| Não | |
|---|---|
| Sim | 8 |
| Value | Count | Frequency (%) | |
| Não | 21194 | > 99.9% | |
| Sim | 8 | < 0.1% |
Length
| Max length | 3 |
|---|---|
| Median length | 3 |
| Mean length | 3 |
| Min length | 3 |
IN_AUTISMO
Categorical
| Distinct count | 2 |
|---|---|
| Unique (%) | < 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Memory size | 165.6 KiB |
| Não | |
|---|---|
| Sim | 10 |
| Value | Count | Frequency (%) | |
| Não | 21192 | > 99.9% | |
| Sim | 10 | < 0.1% |
Length
| Max length | 3 |
|---|---|
| Median length | 3 |
| Mean length | 3 |
| Min length | 3 |
IN_GESTANTE
Categorical
| Distinct count | 2 |
|---|---|
| Unique (%) | < 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Memory size | 165.6 KiB |
| Não | |
|---|---|
| Sim | 1 |
| Value | Count | Frequency (%) | |
| Não | 21201 | > 99.9% | |
| Sim | 1 | < 0.1% |
Length
| Max length | 3 |
|---|---|
| Median length | 3 |
| Mean length | 3 |
| Min length | 3 |
NU_NOTA_CN
Real number (ℝ≥0)
| Distinct count | 3496 |
|---|---|
| Unique (%) | 16.5% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Infinite | 0 |
| Infinite (%) | 0.0% |
| Mean | 506.70531553627023 |
|---|---|
| Minimum | 0.0 |
| Maximum | 793.1 |
| Zeros | 5 |
| Zeros (%) | < 0.1% |
| Memory size | 165.6 KiB |
Quantile statistics
| Minimum | 0 |
|---|---|
| 5-th percentile | 379.51 |
| Q1 | 445.4 |
| median | 509.2 |
| Q3 | 565 |
| 95-th percentile | 633.9 |
| Maximum | 793.1 |
| Range | 793.1 |
| Interquartile range (IQR) | 119.6 |
Descriptive statistics
| Standard deviation | 79.45574755 |
|---|---|
| Coefficient of variation (CV) | 0.1568085929 |
| Kurtosis | -0.2394397488 |
| Mean | 506.7053155 |
| Median Absolute Deviation (MAD) | 59.7 |
| Skewness | 0.02686793599 |
| Sum | 10743166.1 |
| Variance | 6313.215819 |
| Value | Count | Frequency (%) | |
| 552.8 | 23 | 0.1% | |
| 568.4 | 20 | 0.1% | |
| 511.2 | 20 | 0.1% | |
| 475.8 | 19 | 0.1% | |
| 521.8 | 18 | 0.1% | |
| 558.1 | 17 | 0.1% | |
| 504.3 | 17 | 0.1% | |
| 490 | 17 | 0.1% | |
| 566.1 | 17 | 0.1% | |
| 457.7 | 17 | 0.1% | |
| Other values (3486) | 21017 | 99.1% |
| Value | Count | Frequency (%) | |
| 0 | 5 | < 0.1% | |
| 327.9 | 1 | < 0.1% | |
| 328.2 | 1 | < 0.1% | |
| 329.1 | 1 | < 0.1% | |
| 329.9 | 1 | < 0.1% |
| Value | Count | Frequency (%) | |
| 793.1 | 1 | < 0.1% | |
| 781.7 | 1 | < 0.1% | |
| 776.5 | 1 | < 0.1% | |
| 770.6 | 1 | < 0.1% | |
| 766.2 | 1 | < 0.1% |
NU_NOTA_CH
Real number (ℝ≥0)
| Distinct count | 3671 |
|---|---|
| Unique (%) | 17.3% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Infinite | 0 |
| Infinite (%) | 0.0% |
| Mean | 550.6986133383643 |
|---|---|
| Minimum | 0.0 |
| Maximum | 784.1 |
| Zeros | 12 |
| Zeros (%) | 0.1% |
| Memory size | 165.6 KiB |
Quantile statistics
| Minimum | 0 |
|---|---|
| 5-th percentile | 407.61 |
| Q1 | 502.2 |
| median | 558.5 |
| Q3 | 605.1 |
| 95-th percentile | 669.3 |
| Maximum | 784.1 |
| Range | 784.1 |
| Interquartile range (IQR) | 102.9 |
Descriptive statistics
| Standard deviation | 78.93613162 |
|---|---|
| Coefficient of variation (CV) | 0.1433381703 |
| Kurtosis | 1.048989161 |
| Mean | 550.6986133 |
| Median Absolute Deviation (MAD) | 50.9 |
| Skewness | -0.5145783096 |
| Sum | 11675912 |
| Variance | 6230.912875 |
| Value | Count | Frequency (%) | |
| 559 | 22 | 0.1% | |
| 588.3 | 22 | 0.1% | |
| 573.7 | 21 | 0.1% | |
| 553.6 | 21 | 0.1% | |
| 585.7 | 21 | 0.1% | |
| 591.2 | 21 | 0.1% | |
| 572 | 21 | 0.1% | |
| 571.4 | 20 | 0.1% | |
| 562.4 | 20 | 0.1% | |
| 592.9 | 20 | 0.1% | |
| Other values (3661) | 20993 | 99.0% |
| Value | Count | Frequency (%) | |
| 0 | 12 | 0.1% | |
| 315.9 | 4 | < 0.1% | |
| 316.7 | 1 | < 0.1% | |
| 318.7 | 1 | < 0.1% | |
| 320.8 | 1 | < 0.1% |
| Value | Count | Frequency (%) | |
| 784.1 | 1 | < 0.1% | |
| 781.4 | 1 | < 0.1% | |
| 781 | 1 | < 0.1% | |
| 780.7 | 1 | < 0.1% | |
| 779.9 | 1 | < 0.1% |
NU_NOTA_LC
Real number (ℝ≥0)
| Distinct count | 2879 |
|---|---|
| Unique (%) | 13.6% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Infinite | 0 |
| Infinite (%) | 0.0% |
| Mean | 555.1984482595982 |
|---|---|
| Minimum | 0.0 |
| Maximum | 731.2 |
| Zeros | 2 |
| Zeros (%) | < 0.1% |
| Memory size | 165.6 KiB |
Quantile statistics
| Minimum | 0 |
|---|---|
| 5-th percentile | 453.2 |
| Q1 | 522.8 |
| median | 561.6 |
| Q3 | 593 |
| 95-th percentile | 636.2 |
| Maximum | 731.2 |
| Range | 731.2 |
| Interquartile range (IQR) | 70.2 |
Descriptive statistics
| Standard deviation | 56.2227691 |
|---|---|
| Coefficient of variation (CV) | 0.1012660775 |
| Kurtosis | 1.617317383 |
| Mean | 555.1984483 |
| Median Absolute Deviation (MAD) | 34.7 |
| Skewness | -0.7131395904 |
| Sum | 11771317.5 |
| Variance | 3160.999765 |
| Value | Count | Frequency (%) | |
| 563.4 | 29 | 0.1% | |
| 574.3 | 27 | 0.1% | |
| 591.9 | 27 | 0.1% | |
| 597 | 26 | 0.1% | |
| 582.7 | 26 | 0.1% | |
| 581.9 | 26 | 0.1% | |
| 570.4 | 26 | 0.1% | |
| 577.8 | 25 | 0.1% | |
| 575 | 25 | 0.1% | |
| 572 | 25 | 0.1% | |
| Other values (2869) | 20940 | 98.8% |
| Value | Count | Frequency (%) | |
| 0 | 2 | < 0.1% | |
| 322.7 | 1 | < 0.1% | |
| 323.2 | 1 | < 0.1% | |
| 324.1 | 1 | < 0.1% | |
| 324.7 | 1 | < 0.1% |
| Value | Count | Frequency (%) | |
| 731.2 | 1 | < 0.1% | |
| 730.4 | 1 | < 0.1% | |
| 729.8 | 1 | < 0.1% | |
| 722.3 | 1 | < 0.1% | |
| 720.5 | 1 | < 0.1% |
NU_NOTA_MT
Real number (ℝ≥0)
| Distinct count | 4744 |
|---|---|
| Unique (%) | 22.4% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Infinite | 0 |
| Infinite (%) | 0.0% |
| Mean | 567.9710734836336 |
|---|---|
| Minimum | 0.0 |
| Maximum | 985.5 |
| Zeros | 6 |
| Zeros (%) | < 0.1% |
| Memory size | 165.6 KiB |
Quantile statistics
| Minimum | 0 |
|---|---|
| 5-th percentile | 393.505 |
| Q1 | 466.8 |
| median | 562.7 |
| Q3 | 656.5 |
| 95-th percentile | 774.395 |
| Maximum | 985.5 |
| Range | 985.5 |
| Interquartile range (IQR) | 189.7 |
Descriptive statistics
| Standard deviation | 120.5750959 |
|---|---|
| Coefficient of variation (CV) | 0.2122909098 |
| Kurtosis | -0.5732117943 |
| Mean | 567.9710735 |
| Median Absolute Deviation (MAD) | 95.1 |
| Skewness | 0.2854519719 |
| Sum | 12042122.7 |
| Variance | 14538.35376 |
| Value | Count | Frequency (%) | |
| 406.1 | 15 | 0.1% | |
| 438.2 | 15 | 0.1% | |
| 444.9 | 14 | 0.1% | |
| 617.1 | 14 | 0.1% | |
| 470.8 | 13 | 0.1% | |
| 454.3 | 13 | 0.1% | |
| 530.3 | 13 | 0.1% | |
| 523.8 | 13 | 0.1% | |
| 616.8 | 13 | 0.1% | |
| 585.8 | 13 | 0.1% | |
| Other values (4734) | 21066 | 99.4% |
| Value | Count | Frequency (%) | |
| 0 | 6 | < 0.1% | |
| 359 | 6 | < 0.1% | |
| 359.2 | 2 | < 0.1% | |
| 359.3 | 3 | < 0.1% | |
| 359.4 | 1 | < 0.1% |
| Value | Count | Frequency (%) | |
| 985.5 | 1 | < 0.1% | |
| 985 | 1 | < 0.1% | |
| 975.2 | 1 | < 0.1% | |
| 965.1 | 1 | < 0.1% | |
| 963.6 | 1 | < 0.1% |
TP_LINGUA
Categorical
| Distinct count | 2 |
|---|---|
| Unique (%) | < 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Memory size | 165.6 KiB |
| Inglês | |
|---|---|
| Espanhol |
| Value | Count | Frequency (%) | |
| Inglês | 11931 | 56.3% | |
| Espanhol | 9271 | 43.7% |
Length
| Max length | 8 |
|---|---|
| Median length | 6 |
| Mean length | 6.874540138 |
| Min length | 6 |
TP_STATUS_REDACAO
Categorical
| Distinct count | 8 |
|---|---|
| Unique (%) | < 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Memory size | 165.6 KiB |
| Sem problemas | |
|---|---|
| Em Branco | 215 |
| Fuga ao tema | 81 |
| Cópia Texto Motivador | 28 |
| Texto insuficiente | 25 |
| Other values (3) | 51 |
| Value | Count | Frequency (%) | |
| Sem problemas | 20802 | 98.1% | |
| Em Branco | 215 | 1.0% | |
| Fuga ao tema | 81 | 0.4% | |
| Cópia Texto Motivador | 28 | 0.1% | |
| Texto insuficiente | 25 | 0.1% | |
| Anulada | 20 | 0.1% | |
| Parte desconectada | 17 | 0.1% | |
| Não atendimento ao tipo textual | 14 | 0.1% |
Length
| Max length | 31 |
|---|---|
| Median length | 13 |
| Mean length | 12.98231299 |
| Min length | 7 |
| Distinct count | 11 |
|---|---|
| Unique (%) | 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Infinite | 0 |
| Infinite (%) | 0.0% |
| Mean | 131.1263088387888 |
|---|---|
| Minimum | 0.0 |
| Maximum | 200.0 |
| Zeros | 400 |
| Zeros (%) | 1.9% |
| Memory size | 165.6 KiB |
Quantile statistics
| Minimum | 0 |
|---|---|
| 5-th percentile | 100 |
| Q1 | 120 |
| median | 120 |
| Q3 | 160 |
| 95-th percentile | 160 |
| Maximum | 200 |
| Range | 200 |
| Interquartile range (IQR) | 40 |
Descriptive statistics
| Standard deviation | 29.52040571 |
|---|---|
| Coefficient of variation (CV) | 0.2251295409 |
| Kurtosis | 5.443184051 |
| Mean | 131.1263088 |
| Median Absolute Deviation (MAD) | 20 |
| Skewness | -1.491550713 |
| Sum | 2780140 |
| Variance | 871.4543533 |
| Value | Count | Frequency (%) | |
| 120 | 8176 | 38.6% | |
| 160 | 5374 | 25.3% | |
| 140 | 3948 | 18.6% | |
| 100 | 1846 | 8.7% | |
| 180 | 741 | 3.5% | |
| 80 | 568 | 2.7% | |
| 0 | 400 | 1.9% | |
| 200 | 102 | 0.5% | |
| 60 | 39 | 0.2% | |
| 40 | 7 | < 0.1% |
| Value | Count | Frequency (%) | |
| 0 | 400 | 1.9% | |
| 20 | 1 | < 0.1% | |
| 40 | 7 | < 0.1% | |
| 60 | 39 | 0.2% | |
| 80 | 568 | 2.7% |
| Value | Count | Frequency (%) | |
| 200 | 102 | 0.5% | |
| 180 | 741 | 3.5% | |
| 160 | 5374 | 25.3% | |
| 140 | 3948 | 18.6% | |
| 120 | 8176 | 38.6% |
| Distinct count | 10 |
|---|---|
| Unique (%) | < 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Infinite | 0 |
| Infinite (%) | 0.0% |
| Mean | 130.1377228563343 |
|---|---|
| Minimum | 0.0 |
| Maximum | 200.0 |
| Zeros | 400 |
| Zeros (%) | 1.9% |
| Memory size | 165.6 KiB |
Quantile statistics
| Minimum | 0 |
|---|---|
| 5-th percentile | 40 |
| Q1 | 120 |
| median | 120 |
| Q3 | 160 |
| 95-th percentile | 200 |
| Maximum | 200 |
| Range | 200 |
| Interquartile range (IQR) | 40 |
Descriptive statistics
| Standard deviation | 39.89455812 |
|---|---|
| Coefficient of variation (CV) | 0.3065564484 |
| Kurtosis | 1.542219964 |
| Mean | 130.1377229 |
| Median Absolute Deviation (MAD) | 0 |
| Skewness | -0.5179253134 |
| Sum | 2759180 |
| Variance | 1591.575768 |
| Value | Count | Frequency (%) | |
| 120 | 11591 | 54.7% | |
| 200 | 2134 | 10.1% | |
| 160 | 1704 | 8.0% | |
| 140 | 1695 | 8.0% | |
| 180 | 1642 | 7.7% | |
| 40 | 915 | 4.3% | |
| 100 | 634 | 3.0% | |
| 0 | 400 | 1.9% | |
| 80 | 337 | 1.6% | |
| 60 | 150 | 0.7% |
| Value | Count | Frequency (%) | |
| 0 | 400 | 1.9% | |
| 40 | 915 | 4.3% | |
| 60 | 150 | 0.7% | |
| 80 | 337 | 1.6% | |
| 100 | 634 | 3.0% |
| Value | Count | Frequency (%) | |
| 200 | 2134 | 10.1% | |
| 180 | 1642 | 7.7% | |
| 160 | 1704 | 8.0% | |
| 140 | 1695 | 8.0% | |
| 120 | 11591 | 54.7% |
| Distinct count | 11 |
|---|---|
| Unique (%) | 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Infinite | 0 |
| Infinite (%) | 0.0% |
| Mean | 124.7099330251863 |
|---|---|
| Minimum | 0.0 |
| Maximum | 200.0 |
| Zeros | 402 |
| Zeros (%) | 1.9% |
| Memory size | 165.6 KiB |
Quantile statistics
| Minimum | 0 |
|---|---|
| 5-th percentile | 40 |
| Q1 | 120 |
| median | 120 |
| Q3 | 140 |
| 95-th percentile | 180 |
| Maximum | 200 |
| Range | 200 |
| Interquartile range (IQR) | 20 |
Descriptive statistics
| Standard deviation | 37.95368678 |
|---|---|
| Coefficient of variation (CV) | 0.3043357161 |
| Kurtosis | 1.478566227 |
| Mean | 124.709933 |
| Median Absolute Deviation (MAD) | 20 |
| Skewness | -0.695863685 |
| Sum | 2644100 |
| Variance | 1440.48234 |
| Value | Count | Frequency (%) | |
| 120 | 8187 | 38.6% | |
| 140 | 3091 | 14.6% | |
| 160 | 2875 | 13.6% | |
| 100 | 2272 | 10.7% | |
| 180 | 1324 | 6.2% | |
| 80 | 1047 | 4.9% | |
| 40 | 858 | 4.0% | |
| 200 | 836 | 3.9% | |
| 0 | 402 | 1.9% | |
| 60 | 298 | 1.4% |
| Value | Count | Frequency (%) | |
| 0 | 402 | 1.9% | |
| 20 | 12 | 0.1% | |
| 40 | 858 | 4.0% | |
| 60 | 298 | 1.4% | |
| 80 | 1047 | 4.9% |
| Value | Count | Frequency (%) | |
| 200 | 836 | 3.9% | |
| 180 | 1324 | 6.2% | |
| 160 | 2875 | 13.6% | |
| 140 | 3091 | 14.6% | |
| 120 | 8187 | 38.6% |
| Distinct count | 11 |
|---|---|
| Unique (%) | 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Infinite | 0 |
| Infinite (%) | 0.0% |
| Mean | 129.059522686539 |
|---|---|
| Minimum | 0.0 |
| Maximum | 200.0 |
| Zeros | 400 |
| Zeros (%) | 1.9% |
| Memory size | 165.6 KiB |
Quantile statistics
| Minimum | 0 |
|---|---|
| 5-th percentile | 80 |
| Q1 | 120 |
| median | 120 |
| Q3 | 160 |
| 95-th percentile | 200 |
| Maximum | 200 |
| Range | 200 |
| Interquartile range (IQR) | 40 |
Descriptive statistics
| Standard deviation | 35.10860123 |
|---|---|
| Coefficient of variation (CV) | 0.2720341785 |
| Kurtosis | 2.226357041 |
| Mean | 129.0595227 |
| Median Absolute Deviation (MAD) | 20 |
| Skewness | -0.450943454 |
| Sum | 2736320 |
| Variance | 1232.613881 |
| Value | Count | Frequency (%) | |
| 120 | 8685 | 41.0% | |
| 140 | 2776 | 13.1% | |
| 160 | 2705 | 12.8% | |
| 100 | 2674 | 12.6% | |
| 180 | 1424 | 6.7% | |
| 200 | 1249 | 5.9% | |
| 80 | 1121 | 5.3% | |
| 0 | 400 | 1.9% | |
| 60 | 141 | 0.7% | |
| 40 | 24 | 0.1% |
| Value | Count | Frequency (%) | |
| 0 | 400 | 1.9% | |
| 20 | 3 | < 0.1% | |
| 40 | 24 | 0.1% | |
| 60 | 141 | 0.7% | |
| 80 | 1121 | 5.3% |
| Value | Count | Frequency (%) | |
| 200 | 1249 | 5.9% | |
| 180 | 1424 | 6.7% | |
| 160 | 2705 | 12.8% | |
| 140 | 2776 | 13.1% | |
| 120 | 8685 | 41.0% |
| Distinct count | 11 |
|---|---|
| Unique (%) | 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Infinite | 0 |
| Infinite (%) | 0.0% |
| Mean | 105.95698519007641 |
|---|---|
| Minimum | 0.0 |
| Maximum | 200.0 |
| Zeros | 2558 |
| Zeros (%) | 12.1% |
| Memory size | 165.6 KiB |
Quantile statistics
| Minimum | 0 |
|---|---|
| 5-th percentile | 0 |
| Q1 | 80 |
| median | 120 |
| Q3 | 140 |
| 95-th percentile | 200 |
| Maximum | 200 |
| Range | 200 |
| Interquartile range (IQR) | 60 |
Descriptive statistics
| Standard deviation | 57.93745653 |
|---|---|
| Coefficient of variation (CV) | 0.5468016707 |
| Kurtosis | -0.6962138602 |
| Mean | 105.9569852 |
| Median Absolute Deviation (MAD) | 40 |
| Skewness | -0.3816651246 |
| Sum | 2246500 |
| Variance | 3356.748869 |
| Value | Count | Frequency (%) | |
| 120 | 3612 | 17.0% | |
| 0 | 2558 | 12.1% | |
| 80 | 2513 | 11.9% | |
| 100 | 2487 | 11.7% | |
| 160 | 2463 | 11.6% | |
| 140 | 2371 | 11.2% | |
| 180 | 1453 | 6.9% | |
| 200 | 1365 | 6.4% | |
| 60 | 962 | 4.5% | |
| 40 | 834 | 3.9% |
| Value | Count | Frequency (%) | |
| 0 | 2558 | 12.1% | |
| 20 | 584 | 2.8% | |
| 40 | 834 | 3.9% | |
| 60 | 962 | 4.5% | |
| 80 | 2513 | 11.9% |
| Value | Count | Frequency (%) | |
| 200 | 1365 | 6.4% | |
| 180 | 1453 | 6.9% | |
| 160 | 2463 | 11.6% | |
| 140 | 2371 | 11.2% | |
| 120 | 3612 | 17.0% |
| Distinct count | 45 |
|---|---|
| Unique (%) | 0.2% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Infinite | 0 |
| Infinite (%) | 0.0% |
| Mean | 620.9904725969249 |
|---|---|
| Minimum | 0.0 |
| Maximum | 980.0 |
| Zeros | 400 |
| Zeros (%) | 1.9% |
| Memory size | 165.6 KiB |
Quantile statistics
| Minimum | 0 |
|---|---|
| 5-th percentile | 320 |
| Q1 | 540 |
| median | 620 |
| Q3 | 720 |
| 95-th percentile | 900 |
| Maximum | 980 |
| Range | 980 |
| Interquartile range (IQR) | 180 |
Descriptive statistics
| Standard deviation | 174.9668145 |
|---|---|
| Coefficient of variation (CV) | 0.2817544265 |
| Kurtosis | 1.670430955 |
| Mean | 620.9904726 |
| Median Absolute Deviation (MAD) | 100 |
| Skewness | -0.6670422007 |
| Sum | 13166240 |
| Variance | 30613.38616 |
| Value | Count | Frequency (%) | |
| 600 | 1566 | 7.4% | |
| 560 | 1374 | 6.5% | |
| 640 | 1291 | 6.1% | |
| 580 | 1267 | 6.0% | |
| 620 | 1150 | 5.4% | |
| 540 | 967 | 4.6% | |
| 520 | 896 | 4.2% | |
| 680 | 879 | 4.1% | |
| 660 | 845 | 4.0% | |
| 720 | 761 | 3.6% | |
| Other values (35) | 10206 | 48.1% |
| Value | Count | Frequency (%) | |
| 0 | 400 | 1.9% | |
| 80 | 1 | < 0.1% | |
| 140 | 1 | < 0.1% | |
| 160 | 3 | < 0.1% | |
| 180 | 1 | < 0.1% |
| Value | Count | Frequency (%) | |
| 980 | 93 | 0.4% | |
| 960 | 235 | 1.1% | |
| 940 | 304 | 1.4% | |
| 920 | 368 | 1.7% | |
| 900 | 326 | 1.5% |
Q001
Categorical
| Distinct count | 8 |
|---|---|
| Unique (%) | < 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Memory size | 165.6 KiB |
| Completou o Ensino Médio, mas não completou a Faculdade. | |
|---|---|
| Completou a Faculdade, mas não completou a Pós-graduação. | |
| Completou a Pós-graduação. | |
| Não completou a 4ª série/5º ano do Ensino Fundamental. | |
| Completou a 8ª série/9º ano do Ensino Fundamental, mas não completou o Ensino Médio. | |
| Other values (3) |
| Value | Count | Frequency (%) | |
| Completou o Ensino Médio, mas não completou a Faculdade. | 6883 | 32.5% | |
| Completou a Faculdade, mas não completou a Pós-graduação. | 3045 | 14.4% | |
| Completou a Pós-graduação. | 2394 | 11.3% | |
| Não completou a 4ª série/5º ano do Ensino Fundamental. | 2371 | 11.2% | |
| Completou a 8ª série/9º ano do Ensino Fundamental, mas não completou o Ensino Médio. | 2350 | 11.1% | |
| Completou a 4ª série/5º ano, mas não completou a 8ª série/9º ano do Ensino Fundamental. | 2236 | 10.5% | |
| Não sei. | 1642 | 7.7% | |
| Nunca estudou. | 281 | 1.3% |
Length
| Max length | 87 |
|---|---|
| Median length | 56 |
| Mean length | 54.63130837 |
| Min length | 8 |
Q002
Categorical
| Distinct count | 8 |
|---|---|
| Unique (%) | < 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Memory size | 165.6 KiB |
| Completou o Ensino Médio, mas não completou a Faculdade. | |
|---|---|
| Completou a Faculdade, mas não completou a Pós-graduação. | |
| Completou a Pós-graduação. | |
| Completou a 8ª série/9º ano do Ensino Fundamental, mas não completou o Ensino Médio. | |
| Completou a 4ª série/5º ano, mas não completou a 8ª série/9º ano do Ensino Fundamental. | |
| Other values (3) |
| Value | Count | Frequency (%) | |
| Completou o Ensino Médio, mas não completou a Faculdade. | 7731 | 36.5% | |
| Completou a Faculdade, mas não completou a Pós-graduação. | 3489 | 16.5% | |
| Completou a Pós-graduação. | 2997 | 14.1% | |
| Completou a 8ª série/9º ano do Ensino Fundamental, mas não completou o Ensino Médio. | 2488 | 11.7% | |
| Completou a 4ª série/5º ano, mas não completou a 8ª série/9º ano do Ensino Fundamental. | 2002 | 9.4% | |
| Não completou a 4ª série/5º ano do Ensino Fundamental. | 1903 | 9.0% | |
| Não sei. | 363 | 1.7% | |
| Nunca estudou. | 229 | 1.1% |
Length
| Max length | 87 |
|---|---|
| Median length | 56 |
| Mean length | 56.68186963 |
| Min length | 8 |
Q006
Categorical
| Distinct count | 17 |
|---|---|
| Unique (%) | 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Memory size | 165.6 KiB |
| 1 a 1.5 SM | |
|---|---|
| 2 a 2.5 SM | |
| 1.5 a 2 SM | |
| 3 a 4 SM | 1783 |
| 1 SM | 1760 |
| Other values (12) |
| Value | Count | Frequency (%) | |
| 1 a 1.5 SM | 4030 | 19.0% | |
| 2 a 2.5 SM | 2349 | 11.1% | |
| 1.5 a 2 SM | 2244 | 10.6% | |
| 3 a 4 SM | 1783 | 8.4% | |
| 1 SM | 1760 | 8.3% | |
| 2.5 a 3 SM | 1380 | 6.5% | |
| 4 a 5 SM | 1364 | 6.4% | |
| 5 a 6 SM | 1046 | 4.9% | |
| Mais de 20 SM | 965 | 4.6% | |
| 10 a 12 SM | 737 | 3.5% | |
| Other values (7) | 3544 | 16.7% |
Length
| Max length | 14 |
|---|---|
| Median length | 10 |
| Mean length | 9.13107254 |
| Min length | 4 |
Q025
Categorical
| Distinct count | 2 |
|---|---|
| Unique (%) | < 0.1% |
| Missing | 0 |
| Missing (%) | 0.0% |
| Memory size | 165.6 KiB |
| Sim | |
|---|---|
| Não | 2238 |
| Value | Count | Frequency (%) | |
| Sim | 18964 | 89.4% | |
| Não | 2238 | 10.6% |
Length
| Max length | 3 |
|---|---|
| Median length | 3 |
| Mean length | 3 |
| Min length | 3 |
Pearson's r
The Pearson's correlation coefficient (r) is a measure of linear correlation between two variables. It's value lies between -1 and +1, -1 indicating total negative linear correlation, 0 indicating no linear correlation and 1 indicating total positive linear correlation. Furthermore, r is invariant under separate changes in location and scale of the two variables, implying that for a linear function the angle to the x-axis does not affect r.To calculate r for two variables X and Y, one divides the covariance of X and Y by the product of their standard deviations.
Spearman's ρ
The Spearman's rank correlation coefficient (ρ) is a measure of monotonic correlation between two variables, and is therefore better in catching nonlinear monotonic correlations than Pearson's r. It's value lies between -1 and +1, -1 indicating total negative monotonic correlation, 0 indicating no monotonic correlation and 1 indicating total positive monotonic correlation.To calculate ρ for two variables X and Y, one divides the covariance of the rank variables of X and Y by the product of their standard deviations.
Kendall's τ
Similarly to Spearman's rank correlation coefficient, the Kendall rank correlation coefficient (τ) measures ordinal association between two variables. It's value lies between -1 and +1, -1 indicating total negative correlation, 0 indicating no correlation and 1 indicating total positive correlation.To calculate τ for two variables X and Y, one determines the number of concordant and discordant pairs of observations. τ is given by the number of concordant pairs minus the discordant pairs divided by the total number of pairs.
Phik (φk)
Phik (φk) is a new and practical correlation coefficient that works consistently between categorical, ordinal and interval variables, captures non-linear dependency and reverts to the Pearson correlation coefficient in case of a bivariate normal input distribution. There is extensive documentation available here.Cramér's V (φc)
Cramér's V is an association measure for nominal random variables. The coefficient ranges from 0 to 1, with 0 indicating independence and 1 indicating perfect association. The empirical estimators used for Cramér's V have been proved to be biased, even for large samples. We use a bias-corrected measure that has been proposed by Bergsma in 2013 that can be found here.First rows
| NU_INSCRICAO | NU_IDADE | TP_SEXO | TP_ESTADO_CIVIL | TP_COR_RACA | TP_NACIONALIDADE | SG_UF_NASCIMENTO | TP_ST_CONCLUSAO | TP_ANO_CONCLUIU | TP_ESCOLA | TP_ENSINO | IN_TREINEIRO | TP_DEPENDENCIA_ADM_ESC | TP_LOCALIZACAO_ESC | TP_SIT_FUNC_ESC | IN_SURDEZ | IN_SURDO_CEGUEIRA | IN_DEFICIENCIA_FISICA | IN_DEFICIENCIA_MENTAL | IN_DEFICIT_ATENCAO | IN_DISLEXIA | IN_DISCALCULIA | IN_AUTISMO | IN_GESTANTE | NU_NOTA_CN | NU_NOTA_CH | NU_NOTA_LC | NU_NOTA_MT | TP_LINGUA | TP_STATUS_REDACAO | NU_NOTA_COMP1 | NU_NOTA_COMP2 | NU_NOTA_COMP3 | NU_NOTA_COMP4 | NU_NOTA_COMP5 | NU_NOTA_REDACAO | Q001 | Q002 | Q006 | Q025 | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | 190001043648 | 19 | M | Solteiro(a) | Parda | Brasileiro(a) | RS | Já concluí o Ensino Médio | 2018 | Não Respondeu | missing value | Não | missing value | missing value | missing value | Não | Não | Não | Não | Não | Não | Não | Não | Não | 498.0 | 582.1 | 544.5 | 680.7 | Espanhol | Sem problemas | 140.0 | 120.0 | 180.0 | 160.0 | 160.0 | 760.0 | Completou a Pós-graduação. | Completou a Faculdade, mas não completou a Pós-graduação. | 9 a 10 SM | Sim |
| 1 | 190001684765 | 35 | F | Casado(a)/Mora com companheiro(a) | Branca | Brasileiro(a) | RS | Já concluí o Ensino Médio | Antes de 2007 | Não Respondeu | Ensino Regular | Não | missing value | missing value | missing value | Não | Não | Não | Não | Não | Não | Não | Não | Não | 495.0 | 538.5 | 546.8 | 367.3 | Espanhol | Sem problemas | 120.0 | 160.0 | 120.0 | 120.0 | 120.0 | 640.0 | Completou a 8ª série/9º ano do Ensino Fundamental, mas não completou o Ensino Médio. | Completou a 4ª série/5º ano, mas não completou a 8ª série/9º ano do Ensino Fundamental. | 1 SM | Sim |
| 2 | 190001684774 | 18 | F | Não informado | Branca | Brasileiro(a) | RS | Estou cursando e concluirei o Ensino Médio em 2019 | Não informado | Pública | Ensino Regular | Não | missing value | missing value | missing value | Não | Não | Não | Não | Não | Não | Não | Não | Não | 460.4 | 529.1 | 526.9 | 412.6 | Inglês | Sem problemas | 120.0 | 140.0 | 120.0 | 140.0 | 140.0 | 660.0 | Completou o Ensino Médio, mas não completou a Faculdade. | Completou o Ensino Médio, mas não completou a Faculdade. | 2.5 a 3 SM | Sim |
| 3 | 190001684779 | 24 | M | Solteiro(a) | Branca | Brasileiro(a) | RS | Já concluí o Ensino Médio | 2014 | Não Respondeu | missing value | Não | missing value | missing value | missing value | Não | Não | Não | Não | Não | Não | Não | Não | Não | 477.3 | 464.7 | 535.7 | 659.7 | Inglês | Sem problemas | 160.0 | 180.0 | 160.0 | 160.0 | 140.0 | 800.0 | Não completou a 4ª série/5º ano do Ensino Fundamental. | Completou o Ensino Médio, mas não completou a Faculdade. | 1 SM | Sim |
| 4 | 190001684793 | 20 | F | Solteiro(a) | Branca | Brasileiro(a) | RS | Já concluí o Ensino Médio | 2017 | Não Respondeu | Ensino Regular | Não | missing value | missing value | missing value | Não | Não | Não | Não | Não | Não | Não | Não | Não | 465.3 | 537.0 | 557.6 | 393.6 | Inglês | Sem problemas | 140.0 | 120.0 | 120.0 | 120.0 | 120.0 | 620.0 | Completou o Ensino Médio, mas não completou a Faculdade. | Completou a 8ª série/9º ano do Ensino Fundamental, mas não completou o Ensino Médio. | 2 a 2.5 SM | Sim |
| 5 | 190001684797 | 18 | M | Solteiro(a) | Branca | Brasileiro(a) | RS | Estou cursando e concluirei o Ensino Médio em 2019 | Não informado | Pública | Ensino Regular | Não | Estadual | Urbana | Em atividade | Não | Não | Não | Não | Não | Não | Não | Não | Não | 444.0 | 537.0 | 545.5 | 655.8 | Inglês | Sem problemas | 100.0 | 120.0 | 120.0 | 120.0 | 80.0 | 540.0 | Completou a 4ª série/5º ano, mas não completou a 8ª série/9º ano do Ensino Fundamental. | Completou a 8ª série/9º ano do Ensino Fundamental, mas não completou o Ensino Médio. | 2.5 a 3 SM | Sim |
| 6 | 190001684802 | 17 | F | Solteiro(a) | Branca | Brasileiro(a) | RS | Estou cursando e concluirei o Ensino Médio após 2019 | Não informado | Não Respondeu | missing value | Sim | missing value | missing value | missing value | Não | Não | Não | Não | Não | Não | Não | Não | Não | 377.5 | 543.4 | 540.9 | 409.4 | Espanhol | Sem problemas | 160.0 | 120.0 | 140.0 | 180.0 | 100.0 | 700.0 | Completou o Ensino Médio, mas não completou a Faculdade. | Completou a 4ª série/5º ano, mas não completou a 8ª série/9º ano do Ensino Fundamental. | 1.5 a 2 SM | Sim |
| 7 | 190001684803 | 18 | F | Solteiro(a) | Branca | Brasileiro(a) | RS | Estou cursando e concluirei o Ensino Médio em 2019 | Não informado | Privada | Ensino Regular | Não | Privada | Urbana | Em atividade | Não | Não | Não | Não | Não | Não | Não | Não | Não | 561.5 | 554.5 | 522.8 | 470.3 | Inglês | Sem problemas | 140.0 | 140.0 | 120.0 | 160.0 | 120.0 | 680.0 | Completou a Pós-graduação. | Completou a Pós-graduação. | Mais de 20 SM | Sim |
| 8 | 190001684810 | 21 | F | Solteiro(a) | Branca | Brasileiro(a) | RS | Já concluí o Ensino Médio | 2015 | Não Respondeu | missing value | Não | missing value | missing value | missing value | Não | Não | Não | Não | Não | Não | Não | Não | Não | 573.4 | 579.8 | 634.7 | 742.5 | Espanhol | Sem problemas | 120.0 | 200.0 | 160.0 | 160.0 | 140.0 | 780.0 | Completou a 4ª série/5º ano, mas não completou a 8ª série/9º ano do Ensino Fundamental. | Completou a Pós-graduação. | 5 a 6 SM | Sim |
| 9 | 190001684816 | 17 | F | Solteiro(a) | Branca | Brasileiro(a) | RS | Estou cursando e concluirei o Ensino Médio após 2019 | Não informado | Não Respondeu | missing value | Sim | missing value | missing value | missing value | Não | Não | Não | Não | Não | Não | Não | Não | Não | 385.2 | 553.6 | 559.8 | 492.6 | Espanhol | Sem problemas | 140.0 | 120.0 | 120.0 | 120.0 | 80.0 | 580.0 | Completou o Ensino Médio, mas não completou a Faculdade. | Completou o Ensino Médio, mas não completou a Faculdade. | 2.5 a 3 SM | Sim |
Last rows
| NU_INSCRICAO | NU_IDADE | TP_SEXO | TP_ESTADO_CIVIL | TP_COR_RACA | TP_NACIONALIDADE | SG_UF_NASCIMENTO | TP_ST_CONCLUSAO | TP_ANO_CONCLUIU | TP_ESCOLA | TP_ENSINO | IN_TREINEIRO | TP_DEPENDENCIA_ADM_ESC | TP_LOCALIZACAO_ESC | TP_SIT_FUNC_ESC | IN_SURDEZ | IN_SURDO_CEGUEIRA | IN_DEFICIENCIA_FISICA | IN_DEFICIENCIA_MENTAL | IN_DEFICIT_ATENCAO | IN_DISLEXIA | IN_DISCALCULIA | IN_AUTISMO | IN_GESTANTE | NU_NOTA_CN | NU_NOTA_CH | NU_NOTA_LC | NU_NOTA_MT | TP_LINGUA | TP_STATUS_REDACAO | NU_NOTA_COMP1 | NU_NOTA_COMP2 | NU_NOTA_COMP3 | NU_NOTA_COMP4 | NU_NOTA_COMP5 | NU_NOTA_REDACAO | Q001 | Q002 | Q006 | Q025 | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 21192 | 190006113281 | 43 | F | Solteiro(a) | Branca | Brasileiro(a) | RS | Já concluí o Ensino Médio | Antes de 2007 | Não Respondeu | Ensino Regular | Não | missing value | missing value | missing value | Não | Não | Não | Não | Não | Não | Não | Não | Não | 452.9 | 519.2 | 479.0 | 411.3 | Espanhol | Sem problemas | 100.0 | 40.0 | 40.0 | 100.0 | 20.0 | 300.0 | Completou a 4ª série/5º ano, mas não completou a 8ª série/9º ano do Ensino Fundamental. | Completou a 4ª série/5º ano, mas não completou a 8ª série/9º ano do Ensino Fundamental. | 1 a 1.5 SM | Sim |
| 21193 | 190006114814 | 21 | F | Divorciado(a)/Desquitado(a)/Separado(a) | Parda | Brasileiro(a) | RS | Já concluí o Ensino Médio | 2018 | Não Respondeu | Ensino Regular | Não | missing value | missing value | missing value | Não | Não | Não | Não | Não | Não | Não | Não | Não | 453.1 | 412.9 | 466.0 | 475.6 | Espanhol | Sem problemas | 100.0 | 40.0 | 40.0 | 100.0 | 20.0 | 300.0 | Não completou a 4ª série/5º ano do Ensino Fundamental. | Completou a 4ª série/5º ano, mas não completou a 8ª série/9º ano do Ensino Fundamental. | 1 SM | Não |
| 21194 | 190006116330 | 17 | F | Solteiro(a) | Branca | Brasileiro(a) | RS | Estou cursando e concluirei o Ensino Médio em 2019 | Não informado | Pública | Ensino Regular | Não | Estadual | Urbana | Em atividade | Não | Não | Não | Não | Não | Não | Não | Não | Não | 445.0 | 567.2 | 483.4 | 501.7 | Espanhol | Sem problemas | 140.0 | 120.0 | 120.0 | 140.0 | 140.0 | 660.0 | Completou a 8ª série/9º ano do Ensino Fundamental, mas não completou o Ensino Médio. | Completou o Ensino Médio, mas não completou a Faculdade. | 1.5 a 2 SM | Sim |
| 21195 | 190006117730 | 21 | M | Solteiro(a) | Preta | Brasileiro(a) | RS | Já concluí o Ensino Médio | 2016 | Não Respondeu | Ensino Regular | Não | missing value | missing value | missing value | Não | Não | Não | Não | Não | Não | Não | Não | Não | 513.9 | 476.0 | 548.3 | 456.1 | Espanhol | Sem problemas | 120.0 | 40.0 | 40.0 | 120.0 | 0.0 | 320.0 | Completou a 8ª série/9º ano do Ensino Fundamental, mas não completou o Ensino Médio. | Completou a 8ª série/9º ano do Ensino Fundamental, mas não completou o Ensino Médio. | 2.5 a 3 SM | Sim |
| 21196 | 190006117757 | 18 | F | Solteiro(a) | Preta | Brasileiro(a) | RS | Estou cursando e concluirei o Ensino Médio em 2019 | Não informado | Pública | Ensino Regular | Não | Estadual | Urbana | Em atividade | Não | Não | Não | Não | Não | Não | Não | Não | Não | 563.7 | 608.7 | 629.2 | 626.4 | Inglês | Sem problemas | 160.0 | 140.0 | 160.0 | 140.0 | 120.0 | 720.0 | Completou o Ensino Médio, mas não completou a Faculdade. | Completou a Faculdade, mas não completou a Pós-graduação. | 4 a 5 SM | Sim |
| 21197 | 190006117762 | 18 | M | Solteiro(a) | Branca | Brasileiro(a) | RS | Estou cursando e concluirei o Ensino Médio em 2019 | Não informado | Pública | Ensino Regular | Não | Estadual | Urbana | Em atividade | Não | Não | Não | Não | Não | Não | Não | Não | Não | 402.1 | 420.6 | 545.6 | 650.4 | Espanhol | Sem problemas | 140.0 | 80.0 | 80.0 | 100.0 | 0.0 | 400.0 | Completou o Ensino Médio, mas não completou a Faculdade. | Completou o Ensino Médio, mas não completou a Faculdade. | 3 a 4 SM | Sim |
| 21198 | 190006117777 | 18 | M | Solteiro(a) | Branca | Brasileiro(a) | RS | Estou cursando e concluirei o Ensino Médio em 2019 | Não informado | Pública | Ensino Regular | Não | Estadual | Urbana | Em atividade | Não | Não | Não | Não | Não | Não | Não | Não | Não | 449.1 | 548.2 | 538.5 | 557.6 | Espanhol | Sem problemas | 120.0 | 120.0 | 100.0 | 100.0 | 120.0 | 560.0 | Completou o Ensino Médio, mas não completou a Faculdade. | Completou a Faculdade, mas não completou a Pós-graduação. | 3 a 4 SM | Sim |
| 21199 | 190006119127 | 16 | M | Solteiro(a) | Branca | Brasileiro(a) | RS | Estou cursando e concluirei o Ensino Médio após 2019 | Não informado | Não Respondeu | missing value | Sim | missing value | missing value | missing value | Não | Não | Não | Não | Não | Não | Não | Não | Não | 531.2 | 425.3 | 520.5 | 604.2 | Espanhol | Sem problemas | 80.0 | 120.0 | 120.0 | 120.0 | 120.0 | 560.0 | Não completou a 4ª série/5º ano do Ensino Fundamental. | Não completou a 4ª série/5º ano do Ensino Fundamental. | 1 a 1.5 SM | Sim |
| 21200 | 190006119133 | 17 | M | Solteiro(a) | Parda | Brasileiro(a) | BA | Estou cursando e concluirei o Ensino Médio em 2019 | Não informado | Pública | Ensino Regular | Não | Estadual | Urbana | Em atividade | Não | Não | Não | Não | Não | Não | Não | Não | Não | 451.1 | 461.0 | 558.2 | 586.5 | Inglês | Parte desconectada | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | Completou a 4ª série/5º ano, mas não completou a 8ª série/9º ano do Ensino Fundamental. | Completou a Faculdade, mas não completou a Pós-graduação. | 2 a 2.5 SM | Sim |
| 21201 | 190006119150 | 19 | M | Solteiro(a) | Branca | Brasileiro(a) | RS | Já concluí o Ensino Médio | 2017 | Não Respondeu | missing value | Não | missing value | missing value | missing value | Não | Não | Não | Não | Não | Não | Não | Não | Não | 545.1 | 547.3 | 610.7 | 752.9 | Inglês | Sem problemas | 140.0 | 160.0 | 160.0 | 140.0 | 140.0 | 740.0 | Completou o Ensino Médio, mas não completou a Faculdade. | Completou a Faculdade, mas não completou a Pós-graduação. | 4 a 5 SM | Sim |